Importance of joint interpretation of the coefficient of variation and determination in agricultural trials: A case study with bean yield
Importancia de la interpretación conjunta del coeficiente de variación y de determinación en ensayos agrícolas: Un estudio de caso con rendimiento de frijol
Citación sugerida: Gavilánez Luna, F. C. (2025). Importancia de la interpretación conjunta del coeficiente de variación y de determinación en ensayos agrícolas: un estudio de caso con rendimiento de frijol. La Técnica, 15(2), 97-102. DOI: https://doi.org/10.33936/latecnica.v15i2.7320
Recibido: Febrero 25, 2025
Aceptado: Septiembre 22, 2025
Publicado: Octubre 25, 2025
Autores
Universidad Agraria del Ecuador, Guayaquil, Ecuador.
Freddy Carlos Gavilánez Luna
fgavilanez@uagraria.edu.ec
Resumen
Verificar la bondad de un experimento agrícola en los modelos de análisis de varianza (ANOVA) únicamente a través del coeficiente de variación (CV) de sus variables puede inducir a tomar decisiones sobre ensayos poco precisos (error II) o, incluso, llevar al extremo más complicado de recomendar alternativas que en la práctica no tienen efectos significativos (error I). Un estadígrafo que debe acompañar al CV para valorar dicha bondad y que no sea afectado por los grados de libertad del error experimental como en este último, es el coeficiente de determinación (r2). Ante esta situación se propuso detallar demostrativamente un ejemplo práctico para incrementar el juicio de valor de un investigador al momento de aceptar los resultados de un experimento, considerando para ello lo establecido por el CV y el r2 de manera simultánea. Se analizó el rendimiento como variable de un experimento con 24 datos, considerando un diseño de bloques completos al azar con seis tratamientos y cuatro repeticiones. Se comprobaron los supuestos de normalidad, independencia y homocedasticidad de los residuos; se realizó el ANOVA y se calculó el CV, r2 y el índice de repetitividad del ensayo. Se demostró la aparente bondad del experimento al obtenerse un CV de 10,88%, por debajo del límite máximo dado por la literatura (30%); no obstante, que el r2 apenas presentó un valor de 0,47 alejado del límite mínimo de 0,60; lo cual destaca la importancia de observar el CV junto al r2 cuando se examina la solidez de un resultado experimental.
Palabras clave: análisis de varianza, error experimental, sumas de cuadrados, unidad experimental.
Abstract
Verifying the goodness of an agricultural experiment in analysis of variance (ANOVA) models only through the coefficient of variation (CV) of its variables can lead us to make decisions about imprecise trials (error II) or even take us to the extreme. more complicated to recommend alternatives that in practice do not have significant effects (error I). A statistician that must accompany the CV to assess this goodness and that is not affected by the degrees of freedom of the experimental error as in the latter, is the coefficient of determination (r2). Given this situation, it was proposed to demonstratively detail a practical example to increase the value judgment of a researcher when accepting the results of an experiment, considering for this purpose what is established by the CV and the r2 simultaneously. Performance was analyzed as a variable in an experiment with 24 data, considering a randomized complete block design with six treatments and four repetitions. The assumptions of normality, independence and homoscedasticity of the residuals were checked; the ANOVA was performed and the CV, r2, was calculated, in addition to the repeatability index of the trial. The apparent goodness of the experiment was demonstrated by obtaining a CV of 10.88%, well below the maximum limit given by the literature (30%), although the r2 barely presented a value of 0.47 far from the minimum limit of 0.60; which highlights the importance of looking at CV alongside r2 when examining the robustness of an experimental result.
Keywords: analysis of variance, experimental error, experimental unit, sums of squares.
Agricultura y Silvicultura
Introducción
En todo contexto de investigación experimental, los ensayos constituyen herramientas para tomar decisiones, especialmente cuando de éstos depende cambiar una metodología que requiere una mayor inversión, respecto de la que se ha venido empleando en un proceso productivo. De esta situación no son ajenos los experimentos agrícolas, los cuales, en su gran mayoría y especialmente cuando se trata de que estos tengan la suficiente validez externa, sirvan para recomendar sus resultados a un grupo de agricultores de una zona, de tal forma que adopten los cambios sugeridos como el uso de una nueva semilla, una dosis y/o un fertilizante diferente, una nueva forma de preparar el suelo, una aplicación complementaria de nutrientes orgánicos, entre otras; todo con el propósito de lograr una alta rentabilidad.
Sin embargo, en la toma de decisión respecto de los resultados de un experimento se tendrá un riesgo latente de cometer el error I, consistente en rechazar una realidad en la que todos los tratamientos de una prueba tienen un efecto estadísticamente similar (rechazo de hipótesis nula cuando esta es verdadera), produciendo así un falso positivo; o el error II, que se refiere a la declaración de diferencias no significativas entre un grupo de tratamientos cuando estos en verdad tienen efectos distintos (aceptación de hipótesis nula cuando esta es falsa) (Kuehl, 2001), dando lugar a un falso negativo. Para evitar el primero, la única forma de combatirlo es aleatorizando la asignación de tratamientos a las unidades experimentales o viceversa; mientras que, para eludir el segundo, la alternativa es aumentar el número de repeticiones (Gutiérrez y De La Vara, 2008).
El error tipo II está ligado a la precisión de los experimentos y se comete cuando el error experimental alcanza cierto valor, a partir del cual, una herramienta estadística clásica como el análisis de varianza (ANOVA) no logra detectar diferencias significativas entre tratamientos, aunque éstas si existan (Vargas-Rojas et al., 2020). No obstante, la varianza o cuadrado medio del error experimental (CME) puede ser minimizada aumentando el número de repeticiones, con lo cual se consigue una aparente sensibilidad en el experimento para detectar diferencias, reduciendo ilusoriamente el efecto, incluso, de algún posible error sistemático que se haya añadido al error experimental siendo que este último debe ser únicamente aleatorio (Cochran y Cox, 1992).
La mayoría de investigadores agrícolas utilizan el CME para valorar la bondad de sus experimentos a través del coeficiente de variación (CV) (Nardino et al., 2020) aun cuando existen detractores del uso de este último por su dependencia con las medias (Taylor et al., 2008; Vásquez y Caballero, 2011). Sin embargo, el CV ofrece una visión aproximada del cuidado con que se ha manejado un ensayo (Balzarini et al., 2011), considerándose que los valores por encima del 30% son un indicativo de experimentos no confiables (Mićić y Bosančić, 2012; Gordón-Mendoza y Camargo-Buitrago, 2015) cuando sus modelos de ANOVA arrojan diferencias significativas entre tratamientos. En este sentido, el aumento de repeticiones puede hacer que el CV se reduzca, incluso hasta límites de declarar diferencias “significativas” entre tratamientos, pero inviables en términos de rentabilidad que ni siquiera superan los costos de oportunidad del productor (CIMMYT, 1988), especialmente cuando se registra un CV menor al 5% (Mićić y Bosančić, 2012).
En un experimento mal manejado, un número relativamente elevado de repeticiones solo minimizará matemáticamente el error sistemático producido (que no es parte del error experimental); no obstante, éste seguirá presente en el ensayo. Luego, tomar una decisión bajo esta circunstancia puede ser riesgoso. Este riesgo es insuficientemente advertido por el CV debido a que este coeficiente se calcula a partir del CME, es decir, un valor obtenido de la división entre los residuos cuadráticos del error experimental (SCE) de los datos y sus correspondientes grados de libertad (Montgomery, 2004) que están en función del número de repeticiones, lo cual termina ocultando la real variabilidad dentro de cada tratamiento (variabilidad intra-grupos) al presentar un CV supuestamente aceptable (menos del 30%) (Gordón-Mendoza y Camargo-Buitrago, 2015).
Un estadígrafo que debe ser inevitablemente observado de forma complementaria al CV para valorar la precisión de un experimento y poder advertir los defectos antes indicados de éste, es el coeficiente de determinación (r2). Este coeficiente, a diferencia del CV, toma en cuenta la variación absoluta de los datos representada por las sumas de cuadrados, indicando la proporción de variabilidad que se debe a los factores de interés evaluados dentro de un determinado modelo de ANOVA (variabilidad conocida) respecto de la variabilidad total (Montgomery et al., 2006). En este sentido, el r2 de un modelo de ANOVA, el cual puede variar entre 0 y 1, permite observar la variación absoluta (sin afectación de los grados de libertad) que le corresponden al error experimental (1-r2) y tener una mayor certeza de la bondad de un experimento cuando su valor es ≥ 0,7 (Gutiérrez y De La Vara, 2008), o incluso si se considera un límite inferior como el de 0,6 (Balzarini et al., 2011).
El coeficiente de determinación es una de las medidas de ajuste de modelos lineales que más se utiliza, ya sea que éstos tengan objetivos prospectivos u objetivos confirmatorios (García, 2002). Comparativamente, el r2 es más inmutable que el CV en el sentido de que sus valores no se relativizan según el tamaño de la muestra (Chicco et al., 2021) y su capacidad de ser más informativo puede observarse en la selección de los niveles (tratamientos) de los factores de prueba en los experimentos (Gutiérrez y De La Vara, 2008), especialmente aquellos que son de características cuantitativa como los fertilizantes, ya que dosis mal seleccionadas podrían ocasionar una escasa variabilidad conocida, resultando en valores de r2 no aceptables (<0,6) (Balzarini et al., 2011). Además, un aspecto que es destacable del r2 es su capacidad de mantenerse sin cambios aun cuando se recurre a determinadas transformaciones de los datos para estabilizar las varianzas (Bowman y Watson, 1997), constituyéndose en un elemento fundamental al momento de declarar efectos significativos.
Por lo expuesto, esta nota técnica tiene el objetivo de incrementar el juicio de valor de un investigador al momento de aceptar los resultados de un experimento, considerando para ello lo establecido por el CV y el r2 de manera simultánea.
Materiales y métodos
Se utilizaron datos de rendimiento de frijol canario (Phaseolus vulgaris L.), ajustado al 12% de humedad, de uno de los experimentos de práctica desarrollados en el Centro Experimental “El Misionero” de la Universidad Agraria del Ecuador (tabla 1) en la ciudad de Milagro, provincia del Guayas. Las condiciones climáticas de la zona están dadas por una precipitación media anual de 1.297 mm, una humedad relativa del 82%, una temperatura promedio de 25,2 °C y una velocidad del viento de 1,2 m·s-1. El ensayo se realizó como parte del componente práctico de la asignatura de diseño experimental de la carrera de agronomía, en el cual se evaluaron dosis crecientes del lixiviado de un proceso de lombricultura (desde 0 hasta 25 L·ha-1 en intervalos de 5 L·ha-1). El ensayo incluyó seis tratamientos, cada uno con cuatro repeticiones, bajo un diseño de bloques completos al azar. Con el propósito de garantizar la confiabilidad estadística del experimento, se diseñó de manera que el error experimental contara con un mínimo de 12 grados de libertad, conforme al criterio propuesto por Carballo y Quiroga (1976).
Tabla 1. Datos de rendimiento (kg·ha-1) de frijol canario en Milagro, Ecuador 2024.
|
Bloques |
Tratamientos |
||||||
|
T1 (0 L·ha-1) |
T2 (5 L·ha-1) |
T3 (10 L·ha-1) |
T4 (15 L·ha-1) |
T5 (20 L·ha-1) |
T6 (25 L·ha-1) |
Total |
|
|
1 |
990,9 |
1241,4 |
1315,9 |
1368,9 |
1269,9 |
1080,6 |
7267,6 |
|
2 |
860,1 |
1181,0 |
1287,3 |
1148,6 |
1218,7 |
1109,5 |
6805,2 |
|
3 |
1350,2 |
971,0 |
1132,1 |
1311,2 |
1154,9 |
1027,3 |
6946,7 |
|
4 |
957,1 |
1103,1 |
1336,7 |
1222,9 |
1351,2 |
1184,5 |
7155,5 |
|
Total |
4158,3 |
4496,5 |
5072,0 |
5051,6 |
4994,7 |
4401,9 |
28175,0 |
|
Desv. estánd. |
214,38 |
116,73 |
92,84 |
97,01 |
82,97 |
65,55 |
|
|
Medias |
1039,6 |
1124,1 |
1268,0 |
1262,9 |
1248,7 |
1100,5 |
|
Con la información se realizó el ANOVA, previa constatación del cumplimiento de los supuestos de normalidad y homocedasticidad de los residuos de forma analítica y gráfica. Conjuntamente se obtuvo el CV, el r2 y el índice de repetitividad (Ir). Estos análisis se desarrollaron mediante el software RStudio (RStudio Team, 2023).
Resultados y discusión
Los residuos de los datos prácticamente cumplieron con los supuestos de normalidad, homocedasticidad e independencia (figura 1), todo lo cual permitió validar los resultados que se obtuvieron posteriormente mediante el modelo de ANOVA (Montgomery, 2004), aun antes de hacerse evidente la incidencia del valor extremo representado en el tratamiento 1 del bloque 3 a través del diagrama de cajas, del gráfico de homocedasticidad e independencia de los residuales. La incidencia de este único valor no alteró el grado de significancia (P>0,05) revelado con las pruebas estadísticas de Shapiro-Wilk y de Levene, las mismas que verificaron el cumplimiento de normalidad y homocedasticidad de los residuales, respectivamente (tabla 2).
Figura 1. Gráfica para verificación de supuestos del ANOVA.
Las pruebas analíticas para análisis exploratorios de datos experimentales, dado el tamaño muestral que se manejan en éstos, deben aplicarse en conjunto con las evaluaciones gráficas para poder comprobar efectivamente el cumplimiento de los supuestos de normalidad y homocedasticidad de los residuales. En este caso, si se considera únicamente la perspectiva analítica, habría que dar por sentado el cumplimiento de normalidad y homocedasticidad de los datos (tabla 2); sin embargo, el análisis gráfico hizo evidente un valor extremo entre los datos, de allí que se tenga cierta preferencia de este último en los experimentos por cuanto hace posible observar si dicho incumplimiento está soportado por más de dos puntos atípicos que es el límite para restringir irremediablemente el uso de pruebas paramétricas (Gutiérrez y De La Vara, 2008).
Tabla 2. Comprobación analítica de los supuestos de normalidad y homocedasticidad de los datos de rendimiento (kg·ha-1) de frijol canario en Milagro, Ecuador 2024.
|
Prueba |
Estadístico observado |
P-valor |
|
Shapiro - Wilk |
0,9543 |
0,3355 |
|
Levene1 |
1,4303 |
0,2610 |
|
1Tomando de centro a la media. |
El ANOVA de los datos reveló diferencias no significativas (0,090) entre tratamientos (tabla 3) al nivel del 5% de probabilidad. Sin embargo, las diferencias podrían declarase significativas si se tomara como límite un 10% en la probabilidad de error; situación distinta para los bloques, los cuales han revelado una contundente homogeneidad del terreno (P-valor= 0,729). Esta aparente certeza está respaldada por el CV de los datos al estar por debajo del máximo 30% recomendado para los experimentos agrícolas (Balzarini et al., 2011). Sin embargo, si se observan las sumas de cuadrados de las tres fuentes de variación del ANOVA, es destacable la mayor variación que presenta el error experimental (53,3%) con respecto a la de los tratamientos y de bloques, evidenciando una carga importante de varianza “desconocida” que hace que el ensayo sea insensible y no logre detectar diferencias significativas.
Tabla 3. ANOVA de los datos de rendimiento (kg·ha-1) de frijol canario en Milagro, Ecuador 2024.
|
Fuentes de variación |
GL |
SC |
CM |
F |
P-valor |
|
Total |
23 |
459498,52 |
|||
|
Tratamientos |
5 |
193116,31 |
38623,26 |
2,366 |
0,090 |
|
Bloques |
3 |
21486,95 |
7162,32 |
0,439 |
0,729 |
|
Error experimental |
15 |
244895,26 |
16326,35 |
||
|
CV: 10,88%, r2: 0,47, Ir: 0,47. |
La magnitud del error experimental indicado en la tabla 3 queda plenamente resaltada si se observa el coeficiente de determinación del ensayo, con un valor menor que el mínimo recomendado de 0,70 para tener confianza en lo resuelto por un experimento en cuanto a precisión (Gutiérrez y De La Vara, 2008). Complementariamente, esta precisión también puede ser observada mediante el índice de repetitividad (Ir) del experimento, cuyo valor, al estar por debajo de 0,70, es evidencia también de la falta de cuidado del ensayo (Senar,1999).
Al observar el valor del CV, aparentemente se tendría un ensayo de buena precisión y uniforme por cuanto este valor fue menor al 20% (Ruiz-Ramírez, 2010; Mishra et al., 2023). No obstante, la variabilidad mostrada por este indicador resulta un tanto engañosa al observar concomitantemente el r2 del ensayo, el cual revela que la variación explicada efectivamente por el modelo de ANOVA apenas es del 47%; esto es, un experimento que no tiene confiabilidad (Balzarini et al., 2011) debido a la importante variabilidad absoluta desconocida que desmerece cualquier resultado. En este punto es preciso advertir que, entre los diversos ensayos agrícolas, experimentos con valores de CV relativamente altos no necesariamente significa la presencia importante de un error sistemático, dado que este coeficiente depende del tipo de experimento y de la clase de variable que se evalúe (García et al., 2021); sin embargo, el rendimiento es una variable que comúnmente tiene residuales normales debido al control interno de los ensayos (Yaguas, 2017).
Un aspecto defectuoso encubierto por el CV en los experimentos tiene que ver con los grados de libertad del error experimental (GLEE). Su aparente bondad va tomando fuerza a partir de más o menos 12 a 14 GLEE, límites inferiores aproximados desde los cuales varios autores (Mayor-Durán et al., 2012; Mishra et al., 2023) justifican la potencia estadística de pruebas como el ANOVA para lograr sensibilidad experimental. Aun ante ello, tener un experimento con un número elevado de GLEE permite disimular la magnitud absoluta del error experimental a través de la reducción del CV, tal como ha sucedido en este experimento; pudiendo incluso ser contraproducente desde el punto de vista del cometimiento del error tipo I cuando el ANOVA logra detectar mínimas diferencias estadísticas entre tratamientos que, en la aplicación práctica, no son convenientes desde el punto de vista de la rentabilidad (Cumming, 2014; Martínez-Ezquerro et al., 2017) por cuanto la magnitud del incremento en el rendimiento de un cultivo puede no compensar los costos adicionales que más bien disminuirían la utilidad económica del proceso. Además, el incremento excesivo de repeticiones más allá de las necesarias, aparte de generar gastos, tampoco contribuye a un incremento sustantivo de precisión (Martínez-Ezquerro et al., 2017); y que, bajo la presencia de un error no aleatorio por mal manejo experimental, ésta última sería sólo precisión aparente.
Conclusión
La validez de un experimento en cuanto a precisión no debe supeditarse exclusivamente a lo que revela el CV, debido a que este coeficiente puede encubrir la verdadera magnitud del error experimental. Por esta razón es necesario contemplar otros indicadores como el r2, que permitan valorar en términos absolutos y de manera integral el grado de confiabilidad y solidez de un ensayo.
Conflicto de intereses
El autor declara no tener conflictos de interés en la presente publicación en ninguna de sus fases.
Referencias bibliográficas
Balzarini, M., Di Rienzo, J., Tablada, M., González, L., Bruno, C., Córdoba, M., Robledo, W. y Casanoves., F. (2011). Estadística y biometría. Argentina: Editorial Brujas.
Bowman, D. T. & Watson, C. E. (1997). Measures of validity in cultivar performance trials. Agronomy Journal, 89(6), 860-866. https://doi.org/10.2134/agronj1997.00021962008900060003x
Carballo, A. y Quiroga, V. (1976). Manual práctico para el análisis de experimentos de campo. Instituto Interamericano de Ciencias Agrícolas (IICA). https://n9.cl/kvk9a
Centro Internacional de mejoramiento de maíz y trigo (CIMMYT). (1988). La formulación de recomendaciones a partir de datos agronómicos: Un manual metodológico de evaluación económica. México: CIMMYT. https://n9.cl/47h35
Chicco, D., Warrens, M. J. & Jurman, G. (2021). The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation. PeerJ Computer Science, 7:e623. https://doi.org/10.7717/peerj-cs.623
Cochran, W. G. & Cox, G. M. (1992). Experimental designs. Reino Unido: Wiley.
Cumming G. (2014). The new statistics: why and how. Psychol Sci., 25(1), 7-29. doi: 10.1177/0956797613504966.
García, B., Amorin, G., Luciene, K., Suares, P., Bastos, A., Almeida, T., Daieny, A. & Menezes, L. (2021). Classification of the coefficient of variation for experiments with eucalyptus seedlings in greenhouse. Revista Ciência Agronômica, 52(4), e20207587. https://doi.org/10.5935/1806-6690.20210050
García, R. M. (2002). Inferencia estadística y diseño de experimentos. Buenos Aires, Argentina: EUDEBA.
Gordón-Mendoza, R. y Camargo-Buitrago, I. (2015). Selección de estadísticos para la estimación de la precisión experimental en ensayos de maíz. Agronomía Mesoamericana, 26(1), 55-63. http://dx.doi.org/10.15517/am.v26i1.16920
Gutiérrez, H. y De La Vara, R. (2008). Análisis y diseño de experimentos (2da. Ed.). México: McGraw-Hill/Interamericana Editores S.A.
Kuehl, R. O. (2001). Diseño de experimentos: principios estadísticos de diseño y análisis de investigación (2da. Ed.). México: International Thomson Editores S.A.
Mayor-Durán, V., Blair, M. y Muñoz, J. (2012). Metodología para estimar el coeficiente de heterogeneidad del suelo, el número de repeticiones y el tamaño de parcela en investigaciones con frijol (Phaseolus vulgaris L.). Acta Agronómica, 61(1), 32-39. http://www.scielo.org.co/scielo.php?pid=S0120-28122012000100005&script=sci_arttext
Mićić, N. and Bosančić, B. (2012). Variability and variation coefficients in biological and agricultural experimental research. Agroznanje, 13(3), 331-342. https://doi.org/10.7251/AGRSR1203331M
Mishra, P., Hasham, M. M., Manjunatha, G. R., Ray, S., Homa, F. and Pawariya, V. (2023). Role of design of experiment in agriculture trials and its role in decision making. International Journal of Agricultural & Statistical Sciences, 19(1), 389-399. http://dx.doi.org/10.59467/IJASS.2023.19.389
Montgomery, D. C. (2004). Diseño y análisis de experimentos (2da. Ed.). México: Editorial LIMUSA S.A.
Montgomery, D. C., Peck, E. A. y Vining, G. G. (2006). Introducción al análisis de regresión lineal (3era. Ed.). México: Compañía Editorial Continental.
Nardino, M., Machado, J., Torres, V., Costa, F. Dias, F. and Silva, W. (2020). Coefficient of variation: a new approach for the study in maize experiments. Brazilian Journal of Biometrics, 38(2), 185-206. https://doi.org/10.28951/rbb.v38i2.440
RStudio Team. (2023). RStudio: Integrated Development for R [Computer software]. Posit Software, PBC. https://posit.co
Ruiz-Ramírez, J. (2010). Eficiencia relativa y calidad de los experimentos de fertilización en el cultivo de caña de azúcar. Terra Latinoamericana, 28(2), 149-154. https://www.scielo.org.mx/scielo.php?script=sci_arttext&pid=S0187-57792010000200006
Senar, J. C. (1999). La medición de la repetibilidad y el error de medida. Etologuía, 5(17), 53-64. https://www.researchgate.net/publication/233801237_La_medicion_de_la_repetibilidad_y_el_error_de_medida
Taylor, S. L., Payton, M. E. and Raun, W. R. (2008). Relationship between mean yield, coefficient of variation, mean square error, and plot size in wheat field experiments. Communications in Soil Science and Plant Analysis, 30(9-10), 1439-1447. https://doi.org/10.1080/00103629909370298
Vargas-Rojas, J., Vega-Villalobos, E. y Cerdas-Ramírez, R. (2020). Tamaño y forma de la unidad experimental en ensayos de rendimiento de Brachiaria híbrido CIAT ٣٦٠٨. Pastos y Forrajes, 43(2), 144-149. http://scielo.sld.cu/pdf/pyf/v43n2/2078-8452-pyf-43-02-144.pdf
Vásquez, E. R. y Caballero, A. (2011). Inconsistencia del coeficiente de variación para expresar la variabilidad de un experimento en un modelo de análisis de varianza. Cultivos Tropicales, 32(3), 59-62. https://www.redalyc.org/articulo.oa?id=193222357008
Declaración de contribución a la autoría según CRediT
Freddy Carlos Gavilánez Luna: conceptualización, redacción-borrador original, metodología, investigación, análisis formal, redacción-revisión y edición.